Machine Learning spiegato in modo facile by Luis G. Serrano

Machine Learning spiegato in modo facile by Luis G. Serrano

autore:Luis G. Serrano [Serrano, Luis G.]
La lingua: ita
Format: epub
editore: Apogeo
pubblicato: 2024-10-21T23:00:00+00:00


Figura 8.7 Dall’albero precedente abbiamo rimosso i due rami in cui le e-mail non contengono la parola lottery. Delle 100 e-mail originali, ne restano 20 che contengono lottery. Dal momento che di queste 20 email, 15 sono di spam, concludiamo che la probabilità che un’email sia spam dal momento che contiene la parola lottery è 0.75.

Ora abbiamo 20 email e di queste 15 sono di spam e 5 sono di ham. Quindi, la probabilità che un’e-mail sia spam dal momento che contiene la parola lottery è 15 / 20 = 0.75.

Ma lo abbiamo già fatto, quindi qual è il vantaggio del diagramma? Oltre a semplificare le cose, il vantaggio è che normalmente le informazioni di cui disponiamo si basano sulle probabilità e non sul numero di e-mail. Molte volte non sappiamo quante email siano di spam o ham. Tutto quello che sappiamo è quanto segue.

La probabilità che un’e-mail sia di spam è 1 / 5 = 0.2.

La probabilità che un’e-mail di spam contenga la parola lottery è 3 / 4 = 0.75.

La probabilità che un’e-mail di ham contenga la parola lottery è 1/16 = 0.0625.



scaricare



Disconoscimento:
Questo sito non memorizza alcun file sul suo server. Abbiamo solo indice e link                                                  contenuto fornito da altri siti. Contatta i fornitori di contenuti per rimuovere eventuali contenuti di copyright e inviaci un'email. Cancelleremo immediatamente i collegamenti o il contenuto pertinenti.